34 research outputs found

    Development and evaluation of a geographic information retrieval system using fine grained toponyms

    Get PDF
    Geographic information retrieval (GIR) is concerned with returning information in response to an information need, typically expressed in terms of a thematic and spatial component linked by a spatial relationship. However, evaluation initiatives have often failed to show significant differences between simple text baselines and more complex spatially enabled GIR approaches. We explore the effectiveness of three systems (a text baseline, spatial query expansion, and a full GIR system utilizing both text and spatial indexes) at retrieving documents from a corpus describing mountaineering expeditions, centred around fine grained toponyms. To allow evaluation, we use user generated content (UGC) in the form of metadata associated with individual articles to build a test collection of queries and judgments. The test collection allowed us to demonstrate that a GIR-based method significantly outperformed a text baseline for all but very specific queries associated with very small query radii. We argue that such approaches to test collection development have much to offer in the evaluation of GIR

    Cadre d'évaluation de systèmes de recherche d'information géographique Apport de la combinaison des dimensions spatiale, temporelle et thématique

    Get PDF
    National audienceCommon search engines process users' queries, i.e., information needs, by extracting terms from documents. Such approaches are limited regarding particular contexts, such as specialized collections (e.g., cultural heritage collections) or specific retrieval criteria (e.g., multidimensional criteria). In this paper, we consider Geographic Information Retrieval Systems (GIRS) exploiting the spatial, temporal, and topical dimensions. Our contribution is twofold as we propose a GIRS evaluation framework for testing the following assumption: combining spatial and temporal dimensions along with the topical dimension improves GIRS effectiveness

    IRIT, GeoComp, and LIUPPA at the TREC 2013 Contextual Suggestion Track

    Get PDF
    International audienceIn this paper we give an overview of the participation of the IRIT, GeoComp, and LIUPPA labs in the TREC 2013 Contextual Suggestion Track. Our framework combines existing geo-tools or services (e.g., Google Places, Yahoo! BOSS Geo Services, PostGIS, Gisgraphy, GeoNames) and ranks results according to features such as context-place distance, place popularity, and user preferences. We participated in the Open Web and ClueWeb12 sub-tracks with runs IRIT.OpenWeb and IRIT.ClueWeb

    Indexation spatiale et temporelle baséee sur un principe de "tuilage" : contribution à la recherche d'information géographique dans des documents textuels faiblement structurés

    Get PDF
    International audienceLa plupart des moteurs de recherche nécessitent, pour fonctionner, une indexation préalable des documents. Certaines de ces approches sont limitées compte tenu de contextes particuliers ou de la forme particulière de l'information recherchée. Notre contribution porte sur la construction d'index adaptés à la facette spatiale et temporelle spécifique au contexte de l'information géographique tout en permettant une compatibilité avec les outils de recherche génériques. Ce travail présente une stratégie générique d'indexation basée sur le principe du " tuilage ". Elle s'applique aussi bien sur la composante spatiale que temporelle mais peut également être utilisée sur la composante thématique. Nous évaluons ensuite l'apport de cette approche à la recherche d'information géographique

    Normalizing Spatial Information to Better Combine Criteria in Geographical Information Retrieval

    Get PDF
    International audienceIt is generally accepted that geographical information or G.I. (such as texts, maps and tables) is chiefly composed of 3 kinds of criteria : spatial, temporal and thematic criteria. The main focus of this article is spatial criteria. More specifically, we have developed a processing sequence that can extract the spatial information contained in non-structured cultural heritage texts. This processing sequence indexes spatial information, which enables information retrieval (I.R.) based on the same criteria. Our goal is to normalize heterogeneous spatial information. This normalization is carried out at the index level by grouping spatial information together and by using statistics to calculate weights of spatial areas and the pertinence of the results. Thus, we aim to develop a general IR strategy that is dedicated to spatial information, but which can be applied to temporal and thematic information as well. By generalizing this approach, homogeneous IR strategies will be able to combine spatial, temporal and thematic criteria for more efficient geographic IR methods

    Spin density studies on p-O2NC6F4CNSSN: A heavy p-block organic ferromagnet

    Get PDF
    A complete picture of the spin density distribution in the organic radical p-O2NC6F4CNSSN has been obtained by a combination of polarized neutron diffraction, electron paramagnetic resonance (EPR), and electron-nuclear double resonance (ENDOR) spectroscopies, and ab initio density-functional theory (DFT) calculations. Polarized neutron diffraction revealed that the spin distribution is predominantly localized on the N and S atoms (+0.25μB and +0.28μB, respectively) of the heterocyclic ring with a small negative spin density on the heterocyclic C atom (−0.06μB). These spin populations are in excellent agreement with both ab initio DFT calculations (spin populations on the C, N, and S sites of −0.07, 0.22 and 0.31, respectively) and cw-EPR studies which estimated the spin population on the N site as 0.24. The DFT calculated spin density revealed less than 1% spin delocalization onto the perfluoroaryl ring, several orders of magnitude lower than the density on the heterocyclic ring. cw-ENDOR studies at both X-band (9 GHz) and Q-band (34 GHz) frequencies probed the spin populations on the two chemically distinct F atoms. These spin populations on the F atoms ortho and meta to the dithiadiazolyl ring are of magnitude 10−3 and 10−4, respectively

    Combinaison de critères par contraintes pour la Recherche d'Information Géographique

    No full text
    Recent studies show an increasing proportion of queries with geographic criteria on Web search engines. This part is even bigger on specific corpora like cultural heritage collection (e.g. travelogues). We admit that the geographic information is composed of three facets: spatial, temporal and thematic. Works realized in our laboratory aim geographic information extraction from textual documents and the construction of independent and specific indexes for theses three facets. The goal of this thesis is to combine these three facets to support multicriteria searches. This work concerns several fields: Natural Language Processing (NLP), Geographic Information System (GIS), classic Information Retrieval (IR) and Geographic Information Retrieval (GIR). Our first contribution is about an original combination approach of specific indexes. During the retrieval process, it consists first in querying the different indexes independently and then combining the results lists. We propose also a user to personalize this combination with constraints. In order to realize this combination, we propose to imitate the homogenization approaches used in classical IR strategies that represent terms with corresponding lemmas. For geographic information, it consists in segmenting them on tiles and on using their occurrence frequency. So, our second contribution concerns a generic standardization approach implemented on spatial and temporal information. In order to evaluate these different propositions, we have tested and validated them via several prototypes and experimentations. The last contribution relates to an evaluation framework for GIR systems. Thanks to this framework, we verified and quantified the benefit of combining the different geographic information facets and also have compared several combination approaches.Des études récentes montrent une part croissante de requêtes sur les moteurs de recherche du Web comportant des critères géographiques. Cette part est encore plus conséquente sur des corpus plus spécifiques tels que des documents patrimoniaux (récits de voyages par exemple). On admet que l'information géographique est composée de trois facettes : le spatial, le temporel et le thématique. Les travaux effectués dans notre laboratoire visent l'extraction et la construction d'index indépendants et spécifiques aux trois facettes (spatiales, temporelles et thématiques). L'objet de ce travail de thèse est de combiner les trois facettes pour effectuer des recherches multicritère. Ce travail s'intègre au croisement de plusieurs disciplines : Traitement Automatique des Langages Naturels (TALN), Systèmes d'Information Géographique (SIG), Recherche d'Information classique (RI) et Recherche d'Information Géographique (RIG). Notre première contribution porte sur une méthode originale de combinaison des index spécifiques. Lors de l'interrogation il s'agit de questionner de manières indépendantes les différents index puis de combiner les listes de résultats restitués lors de leur interrogation. De plus, nous proposons à un utilisateur de personnaliser cette combinaison par des contraintes. Pour pouvoir effectuer cette combinaison, nous proposons d'imiter les approches d'homogénéisation utilisées dans les stratégies de RI classiques portant sur des termes et les lemmes correspondants. Pour les informations géographiques il s'agit de les redécouper en tuiles et de travailler sur leur fréquence d'apparition. Notre deuxième contribution porte sur une approche d'uniformisation générique mise en œuvre sur l'information spatiale et l'information temporelle. Afin d'évaluer ces différentes propositions, nous les avons testées et validées via différents prototypes et expérimentations. La dernière contribution consiste en un cadre d'évaluation d'un système de recherche géographique. Grâce à ce cadre nous avons pu vérifier et quantifier l'apport de la combinaison de critères géographiques ainsi que comparer différentes approches de combinaisons

    Indexation multi-critères et différentes approches de combinaison

    No full text
    National audienceCe papier s'inscrit dans la continuité de travaux sur l'indexation et la recherche d'information menés au LIUPPA sur des critères géographiques. L'information géographique a trois composantes : le spatial, le temporel et le thématique. Notre équipe a déjà travaillé sur le spatial et le temporel de façon indépendante. Aujourd'hui nous cherchons à combiner ces différentes composantes. Pour cela nous proposons d'utiliser une approche statistique, réservée habituellement à l'analyse plein-texte d'un document, pour le spatial et le temporel. Cette approche sera qualifiée de "carroyage". Toutefois nous cherchons aussi à extraire les liens sémantiques existants entre les informations géographiques. Pour cela nous étudions un autre type de combinaison, qualifiée "d'approche par motifs"

    Combinaison de critères par contraintes pour la Recherche d'Information Géographique

    No full text
    Des études récentes montrent une part croissante de requêtes sur les moteurs de recherche du Web comportant des critères géographiques. Cette part est encore plus conséquente sur des corpus plus spécifiques tels que des documents patrimoniaux (récits de voyages par exemple). On admet que l'information géographique est composée de trois facettes : le spatial, le temporel et le thématique. L'objet de ce travail de thèse est de combiner les trois facettes pour effectuer des recherches multicritère. Ce travail s'intègre au croisement de plusieurs disciplines : Traitement Automatique des Langages Naturels (TALN), Systèmes d'Information Géographique (SIG), Recherche d'Information classique (RI) et Recherche d'Information Géographique (RIG). Notre première contribution porte sur une méthode originale de combinaison des index spécifiques. Lors de l'interrogation il s'agit de questionner de manières indépendantes les différents index puis de combiner les listes de résultats restitués lors de leur interrogation (via des contraintes). Pour pouvoir effectuer cette combinaison, nous proposons d'imiter les approches d'homogénéisation utilisées dans les stratégies de RI classiques portant sur des termes et les lemmes correspondants. Notre deuxième contribution porte sur une approche d'uniformisation générique mise en oeuvre sur l'information spatiale et l'information temporelle. La dernière contribution consiste en un cadre d'évaluation d'un système de recherche géographique. Grâce à ce cadre nous avons pu vérifier et quantifier l'apport de la combinaison de critères géographiques ainsi que comparer différentes approches de combinaisons.Recent studies show an increasing proportion of queries with geographic criteria on Web search engines. This part is even bigger on specific corpora like cultural heritage collection (e.g. travelogues). We admit that the geographic information is composed of three facets: spatial, temporal and thematic. The goal of this thesis is to combine these three facets to support multicriteria searches. This work concerns several fields: Natural Language Processing (NLP), Geographic Information System (GIS), classic Information Retrieval (IR) and Geographic Information Retrieval (GIR). Our first contribution is about an original combination approach of specific indexes. During the retrieval process, it consists first in querying the different indexes independently and then combining the results lists. We propose also a user to personalize this combination with constraints. In order to realize this combination, we propose to imitate the homogenization approaches used in classical IR strategies that represent terms with corresponding lemmas. So, our second contribution concerns a generic standardization approach implemented on spatial and temporal information. In order to evaluate these different propositions, we have tested and validated them via several prototypes and experimentations. The last contribution relates to an evaluation framework for GIR systems. Thanks to this framework, we verified and quantified the benefit of combining the different geographic information facets and also have compared several combination approaches.PAU-BU Sciences (644452103) / SudocSudocFranceF

    Creating test collections from user generated content for GIR evaluation

    Full text link
    Evaluation of the effectiveness of Geographic Information Retrieval (GIR) systems is challenging and time consuming. We describe an approach to such evaluations, where we use user generated content in the form of text and associated metadata to build a large test colletion automatically. We can thus show that the UGC test collection is useful for evaluating and exploring some of the critical aspects of a GIR, for instance by submitting large numbers of queries
    corecore